智能论文笔记

Weight-based Channel-model Matrix Framework: a reasonable solution for EEG-based cross-dataset emotion recognition

Huayu Chen , Huanhuan He , Shuting Sun , Jianxiu Li , Xuexiao Shao , Junxiang Li , Xiaowei Li , Bin Hu

分类：机器学习

2022-09-13

在基于脑电图的情感计算领域，跨数据库情绪识别是一项极具挑战性的任务，受许多因素的影响，这使得通用模型产生了不令人满意的结果。面对缺乏脑电图信息解码研究的情况，我们首先分析了通过样本空间可视化，样本聚合现象量化和对五个公共数据集的能量模式分析的不同脑电图信息（个人，会话，情绪，试验）对情绪识别的影响。并基于这些现象和模式，我们提供了各种脑电图差异的处理方法和可解释的工作。通过分析情绪特征分布模式，发现了个体的情感特征分布差异（IEFDD）。在分析了IEFDD遭受的传统建模方法的局限性之后，我们提出了基于重量的通道模型矩阵框架（WCMF）。为了合理地表征情绪特征分布模式，设计了四种重量提取方法，最佳是校正t检验（CT）重量提取方法。最后，WCMF的性能在两种实验中在跨数据库任务上进行了验证，这些实验模拟了不同的实践场景，结果表明WCMF具有更稳定和更好的情感识别能力。

translated by 谷歌翻译

Source Localization of Graph Diffusion via Variational Autoencoders for Graph Inverse Problems

Chen Ling , Junji Jiang , Junxiang Wang , Liang Zhao

分类：机器学习

2022-06-24

图扩散问题，例如谣言，计算机病毒或智能电网故障的传播是无处不在的和社会的。因此，根据当前的图扩散观测值鉴定扩散源通常至关重要。尽管在实践中具有巨大的必要性和意义，但作为图扩散的逆问题，源定位是极具挑战性的，因为它的规模不足：不同的来源可能导致相同的图形扩散模式。与大多数传统的来源本地化方法不同，本文着重于概率方式，以说明不同候选来源的不确定性。这样的努力需要克服挑战，包括1）很难量化图形扩散源定位的不确定性； 2）图形扩散源的复杂模式很难被概率地表征； 3）很难强加任何潜在的扩散模式下的概括。为了解决上述挑战，本文提出了一个通用框架：用于在任意扩散模式下定位扩散源的源定位变异自动编码器（SL-VAE）。特别是，我们提出了一个概率模型，该模型利用正向扩散估计模型以及深生成模型来近似扩散源分布，以量化不确定性。 SL-VAE进一步利用了对源观察对的先验知识来表征通过学识渊博的生成性先验的扩散源的复杂模式。最后，一个集成正向扩散估计模型的统一目标被得出以强制执行模型以在任意扩散模式下概括。在7个现实世界数据集上进行了广泛的实验，以证明SL-VAE在重建扩散源的优势通过在AUC分数中平均20％来重建扩散源。

translated by 谷歌翻译

Do Multi-Lingual Pre-trained Language Models Reveal Consistent Token Attributions in Different Languages?

Junxiang Wang , Xuchao Zhang , Bo Zong , Yanchi Liu , Wei Cheng , Jingchao Ni , Haifeng Chen , Liang Zhao

分类：自然语言处理

2021-12-23

在过去几年中，已经提出了多语言预训练的语言模型（PLMS）的激增，以实现许多交叉曲线下游任务的最先进的性能。但是，了解为什么多语言PLMS表现良好仍然是一个开放域。例如，目前尚不清楚多语言PLM是否揭示了不同语言的一致令牌归因。要解决此问题，请在本文中提出了令牌归因（CCTA）评估框架的交叉致新一致性。三个下游任务中的广泛实验表明，多语言PLMS为多语素同义词分配了显着不同的归因。此外，我们有以下观察结果：1）当它用于培训PLMS时，西班牙语在不同语言中实现了最常见的令牌归属;2）令牌归属的一致性与下游任务中的性能强烈相关。

translated by 谷歌翻译

Hierarchical Amortized Training for Memory-efficient High Resolution 3D GAN

Li Sun , Junxiang Chen , Yanwu Xu , Mingming Gong , Ke Yu , Kayhan Batmanghelich

分类：计算机视觉

2020-08-05

生成对抗网络（GAN）具有许多潜在的医学成像应用，包括数据扩展，域适应和模型解释。由于图形处理单元（GPU）的记忆力有限，因此在低分辨率的医学图像上对当前的3D GAN模型进行了训练，因此这些模型要么无法扩展到高分辨率，要么容易出现斑驳的人工制品。在这项工作中，我们提出了一种新颖的端到端GAN体系结构，可以生成高分辨率3D图像。我们通过使用训练和推理之间的不同配置来实现这一目标。在训练过程中，我们采用了层次结构，该结构同时生成图像的低分辨率版本和高分辨率图像的随机选择子量。层次设计具有两个优点：首先，对高分辨率图像训练的记忆需求在子量之间摊销。此外，将高分辨率子体积固定在单个低分辨率图像上可确保子量化之间的解剖一致性。在推断期间，我们的模型可以直接生成完整的高分辨率图像。我们还将具有类似层次结构的编码器纳入模型中，以从图像中提取特征。 3D胸CT和脑MRI的实验表明，我们的方法在图像生成中的表现优于最新技术。我们还证明了所提出的模型在数据增强和临床相关特征提取中的临床应用。

translated by 谷歌翻译

PercentMatch: Percentile-based Dynamic Thresholding for Multi-Label Semi-Supervised Classification

Junxiang Huang , Alexander Huang , Beatriz C. Guerra , Yen-Yun Yu

分类：计算机视觉

2022-08-30

尽管半监督学习（SSL）的最新研究已经在单标签分类问题上取得了强劲的表现，但同样重要但毫无疑问的问题是如何利用多标签分类任务中未标记数据的优势。为了将SSL的成功扩展到多标签分类，我们首先使用说明性示例进行分析，以获得有关多标签分类中存在的额外挑战的一些直觉。基于分析，我们提出了一个基于百分比的阈值调整方案的百分位摩擦，以动态地改变训练期间每个类别的正和负伪标签的得分阈值，以及动态的未标记失误权重，从而进一步降低了从早期未标记的预测。与最近的SSL方法相比，在不丧失简单性的情况下，我们在Pascal VOC2007和MS-Coco数据集上实现了强劲的性能。

translated by 谷歌翻译

An Invertible Graph Diffusion Neural Network for Source Localization

Junxiang Wang , Junji Jiang , Liang Zhao

分类：机器学习

2022-06-18

将图形扩散现象的来源定位，例如错误信息传播，是一项重要但极具挑战性的任务。现有的源本地化模型通常在很大程度上取决于手工制作的规则。不幸的是，许多应用程序的图扩散过程的很大一部分仍然是人类未知的，因此拥有自动学习此类基础规则的表达模型很重要。本文旨在建立一个可逆图扩散模型的通用框架，用于在图上源定位，即可逆有效性感知图扩散（IVGD），以应对主要挑战，包括1）难以利用图形扩散模型中的知识来建模其反相反过程以端到端的方式，2）难以确保推断来源的有效性，3）源推理的效率和可扩展性。具体而言，首先，为了反向推断图形扩散源，我们提出了图形残差方案，以使现有的图形扩散模型具有理论保证。其次，我们开发了一种新颖的错误补偿机制，该机制学会抵消推断来源的错误。最后，为了确保推断资源的有效性，通过灵活地通过使用展开的优化技术来灵活地编码约束来，已经设计了一组新的有效性层层将推断为可行区域的源。提出了一种线性化技术来增强我们提出的层的效率。理论上证明了所提出的IVGD的收敛性。对九个现实世界数据集进行的广泛实验表明，我们提出的IVGD的表现明显优于最先进的比较方法。我们已经在https://github.com/xianggebenben/ivgd上发布了代码。

translated by 谷歌翻译

A Convergent ADMM Framework for Efficient Neural Network Training

Junxiang Wang , Hongyi Li , Liang Zhao

分类：机器学习

2021-12-22

作为众所周知的优化框架，乘法器（ADMM）的交替方向方法在许多分类和回归应用中取得了巨大的成功。最近，它引起了深度学习研究人员的注意，被认为是梯度下降（GD）的潜在替代品。然而，作为新兴领域，一些挑战仍未解决，包括1）缺乏全球收敛保证，2）对解决方案的收敛缓慢，以及3）立方时间复杂于特征尺寸。在本文中，我们提出了一种新颖的优化框架，以通过ADMM（DLADMM）解决一般神经网络训练问题，同时解决这些挑战。具体地，每层中的参数被向后更新，然后向前移动，以便有效地交换每层中的参数信息。当DLADMM应用于特定架构时，通过使用二次近似和回溯技术，通过专用算法设计从立方到二次数据的时间复杂度。最后但并非最不重要的是，我们在温和条件下向第一个趋同的趋同点提供延长的临界点（DLADMM）。七个基准数据集的实验证明了我们提出的DLADMM算法的收敛性，效率和有效性。

translated by 谷歌翻译

Community-based Layerwise Distributed Training of Graph Convolutional Networks

Hongyi Li , Junxiang Wang , Yongchao Wang , Yue Cheng , Liang Zhao

分类：机器学习

2021-12-17

图表卷积网络（GCN）已成功应用于许多基于图形的应用程序。然而，培训大规模的GCN模型仍然具有挑战性：由于GCN架构的节点依赖性和层依赖性，培训过程中需要大量的计算时间和内存。在本文中，我们提出了一种基于乘法器（ADMM）的交替方向方法的平行和分布式GCN训练算法，同时解决两个挑战。我们首先将GCN层分成独立块以实现层并行性。此外，通过将图形划分为几个密集的社区来降低节点依赖性，使得它们中的每一个可以并行地用代理训练。最后，我们为基于社区的ADMM算法中的所有子问题提供了解决方案。初步结果表明，我们所提出的基于社区的ADMM培训算法可能导致三倍超速，同时与最先进的方法相比，实现了最佳性能。

translated by 谷歌翻译

Generative appearance replay for continual unsupervised domain adaptation

Boqi Chen , Kevin Thandiackal , Pushpak Pati , Orcun Goksel

分类：计算机视觉 | 人工智能

2023-01-03

Deep learning models can achieve high accuracy when trained on large amounts of labeled data. However, real-world scenarios often involve several challenges: Training data may become available in installments, may originate from multiple different domains, and may not contain labels for training. Certain settings, for instance medical applications, often involve further restrictions that prohibit retention of previously seen data due to privacy regulations. In this work, to address such challenges, we study unsupervised segmentation in continual learning scenarios that involve domain shift. To that end, we introduce GarDA (Generative Appearance Replay for continual Domain Adaptation), a generative-replay based approach that can adapt a segmentation model sequentially to new domains with unlabeled data. In contrast to single-step unsupervised domain adaptation (UDA), continual adaptation to a sequence of domains enables leveraging and consolidation of information from multiple domains. Unlike previous approaches in incremental UDA, our method does not require access to previously seen data, making it applicable in many practical scenarios. We evaluate GarDA on two datasets with different organs and modalities, where it substantially outperforms existing techniques.

translated by 谷歌翻译

MGTAB: A Multi-Relational Graph-Based Twitter Account Detection Benchmark

Shuhao Shi , Kai Qiao , Jian Chen , Shuai Yang , Jie Yang , Baojie Song , Linyuan Wang , Bin Yan

分类：计算机视觉

2023-01-03

The development of social media user stance detection and bot detection methods rely heavily on large-scale and high-quality benchmarks. However, in addition to low annotation quality, existing benchmarks generally have incomplete user relationships, suppressing graph-based account detection research. To address these issues, we propose a Multi-Relational Graph-Based Twitter Account Detection Benchmark (MGTAB), the first standardized graph-based benchmark for account detection. To our knowledge, MGTAB was built based on the largest original data in the field, with over 1.55 million users and 130 million tweets. MGTAB contains 10,199 expert-annotated users and 7 types of relationships, ensuring high-quality annotation and diversified relations. In MGTAB, we extracted the 20 user property features with the greatest information gain and user tweet features as the user features. In addition, we performed a thorough evaluation of MGTAB and other public datasets. Our experiments found that graph-based approaches are generally more effective than feature-based approaches and perform better when introducing multiple relations. By analyzing experiment results, we identify effective approaches for account detection and provide potential future research directions in this field. Our benchmark and standardized evaluation procedures are freely available at: https://github.com/GraphDetec/MGTAB.

translated by 谷歌翻译